Id | Sentence |
---|---|
1198 | Афіцыйнае выданьне Эўразьвязу Official Journal of the European Union апублікавала дадатак да сьпісу беларускіх чыноўнікаў і кампаніяў, супраць якіх дзейнічаюць санкцыі ЭЗ. |
2287 | Гэтая ж вёска знаходзіцца, кажучы па-падляску, u čorta na vysranci, або, па-ангельску, in the middle of nowhere.. |
3569 | І не пасьпеў the teacher did reply, як прафэсар Буё прамовіў свой кароткі маналёг, падскочыў да фізыка Мансэля, які арганізаваў мярзотнае відовішча, і пачаў яго душыць. |
5035 | На днях, нагадвае The Times, міністар унутраных справаў Югаславіі Зоран Жывковіч заявіў, што за два тыдні павінна быць прынята рашэньне пра выдачу Мілошавіча Міжнароднаму ваеннаму трыбуналу ў Гаазе. |
Most corpora contain snippets of foreign language text. It is interesting to see where such snippets come from. In this subsection we present sample sentences (of more than 40 characters) of the corpus containing the stopwords the, de, and dem
The foreign language stopwords are chosen to identify snippets in English (the), French, Spanish, Italian (de) or German (dem).
select s_id,sentence from sentences where sentence like "% the %" and length(sentence)>40 limit 10;
Please add more stopwords for more languages.
3.2.4.1 Rank for some international stopwords